۱۴ مهر ۱۴۰۴فارسی

آزمون فرضیه آماری را در پایتون مسلط شوید. این راهنما مفاهیم، روش ها و کاربردهای عملی برای علم داده را پوشش می دهد.

علم داده پایتون: راهنمای جامع برای آزمون فرضیه آماری

آزمون فرضیه آماری جنبه مهمی از علم داده است و به ما امکان می دهد تصمیمات آگاهانه ای را بر اساس داده ها اتخاذ کنیم. این چارچوبی را برای ارزیابی شواهد و تعیین اینکه آیا ادعایی در مورد یک جمعیت احتمالاً درست است یا خیر، ارائه می دهد. این راهنمای جامع مفاهیم اصلی، روش ها و کاربردهای عملی آزمون فرضیه آماری را با استفاده از پایتون بررسی می کند.

آزمون فرضیه آماری چیست؟

در هسته خود، آزمون فرضیه فرآیندی است برای استفاده از داده های نمونه برای ارزیابی ادعایی در مورد یک جمعیت. این شامل تدوین دو فرضیه رقیب است: فرضیه صفر (H0) و فرضیه جایگزین (H1).

فرضیه صفر (H0): این گزاره ای است که آزمایش می شود. به طور معمول نشان دهنده وضعیت موجود یا عدم وجود اثر است. به عنوان مثال، "میانگین قد مردان و زنان یکسان است."
فرضیه جایگزین (H1): این گزاره ای است که ما در تلاش هستیم شواهدی برای حمایت از آن پیدا کنیم. این با فرضیه صفر مغایرت دارد. به عنوان مثال، "میانگین قد مردان و زنان متفاوت است."

هدف از آزمون فرضیه تعیین این است که آیا شواهد کافی برای رد فرضیه صفر به نفع فرضیه جایگزین وجود دارد یا خیر.

مفاهیم کلیدی در آزمون فرضیه

درک مفاهیم زیر برای انجام و تفسیر آزمون های فرضیه ضروری است:

مقدار P

مقدار p احتمال مشاهده یک آماره آزمون به اندازه یا شدیدتر از آماره محاسبه شده از داده های نمونه است، با این فرض که فرضیه صفر درست است. یک مقدار p کوچک (به طور معمول کمتر از سطح اهمیت، آلفا) شواهد قوی علیه فرضیه صفر را نشان می دهد.

سطح اهمیت (آلفا)

سطح اهمیت (α) یک آستانه از پیش تعیین شده است که میزان شواهد مورد نیاز برای رد فرضیه صفر را تعریف می کند. مقادیر معمول مورد استفاده برای آلفا 0.05 (5٪) و 0.01 (1٪) هستند. اگر مقدار p کمتر از آلفا باشد، فرضیه صفر را رد می کنیم.

خطای نوع اول و نوع دوم

در آزمون فرضیه، دو نوع خطا وجود دارد که می توانیم مرتکب شویم:

خطای نوع اول (مثبت کاذب): رد فرضیه صفر در حالی که در واقع درست است. احتمال ارتکاب خطای نوع اول برابر با آلفا (α) است.
خطای نوع دوم (منفی کاذب): عدم رد فرضیه صفر در حالی که در واقع نادرست است. احتمال ارتکاب خطای نوع دوم با بتا (β) نشان داده می شود.

توان یک آزمون

توان یک آزمون احتمال رد صحیح فرضیه صفر در زمانی است که نادرست است (1 - β). یک آزمون با توان بالا به احتمال زیاد یک اثر واقعی را تشخیص می دهد.

آماره آزمون

آماره آزمون یک عدد واحد است که از داده های نمونه محاسبه می شود و برای تعیین اینکه آیا فرضیه صفر رد شود یا خیر استفاده می شود. نمونه ها شامل آماره t، آماره z، آماره F و آماره کای مربع است. انتخاب آماره آزمون بستگی به نوع داده ها و فرضیه ای دارد که آزمایش می شود.

فواصل اطمینان

فاصله اطمینان محدوده ای از مقادیر را فراهم می کند که پارامتر واقعی جمعیت به احتمال زیاد با سطح معینی از اطمینان در آن قرار می گیرد (به عنوان مثال، اطمینان 95٪). فواصل اطمینان با آزمون های فرضیه مرتبط هستند. اگر مقدار فرضیه صفر خارج از فاصله اطمینان قرار گیرد، فرضیه صفر را رد می کنیم.

آزمون های فرضیه رایج در پایتون

ماژول scipy.stats پایتون طیف گسترده ای از توابع را برای انجام آزمون های فرضیه آماری ارائه می دهد. در اینجا برخی از رایج ترین آزمون های مورد استفاده آورده شده است:

1. آزمون های T

آزمون های T برای مقایسه میانگین های یک یا دو گروه استفاده می شوند. سه نوع اصلی آزمون t وجود دارد:

آزمون T تک نمونه ای: برای مقایسه میانگین یک نمونه واحد با میانگین جمعیت شناخته شده استفاده می شود.
آزمون T نمونه های مستقل (آزمون T دو نمونه ای): برای مقایسه میانگین های دو گروه مستقل استفاده می شود. این آزمون فرض می کند که واریانس های دو گروه برابر هستند (یا در صورت عدم وجود می توان آنها را تنظیم کرد).
آزمون T نمونه های زوجی: برای مقایسه میانگین های دو گروه مرتبط استفاده می شود (به عنوان مثال، اندازه گیری های قبل و بعد از روی افراد مشابه).

مثال (آزمون T تک نمونه ای):

فرض کنید می خواهیم آزمایش کنیم که آیا میانگین نمره امتحان دانش آموزان در یک مدرسه خاص (ژاپن) به طور قابل توجهی با میانگین کشوری (75) متفاوت است یا خیر. ما نمونه ای از نمرات امتحان 30 دانش آموز را جمع آوری می کنیم.

```python import numpy as np from scipy import stats # داده های نمونه (نمرات امتحان) scores = np.array([82, 78, 85, 90, 72, 76, 88, 80, 79, 83, 86, 74, 77, 81, 84, 89, 73, 75, 87, 91, 71, 70, 92, 68, 93, 95, 67, 69, 94, 96]) # میانگین جمعیت population_mean = 75 # انجام آزمون t تک نمونه ای t_statistic, p_value = stats.ttest_1samp(scores, population_mean) print("T-statistic:", t_statistic) print("P-value:", p_value) # بررسی اینکه آیا مقدار p کمتر از آلفا است (به عنوان مثال، 0.05) alpha = 0.05 if p_value < alpha: print("Reject the null hypothesis") else: print("Fail to reject the null hypothesis") ```

مثال (آزمون T نمونه های مستقل):

بیایید بگوییم می خواهیم میانگین درآمد مهندسان نرم افزار را در دو کشور مختلف (کانادا و استرالیا) مقایسه کنیم. ما داده های درآمد را از نمونه های مهندسان نرم افزار در هر کشور جمع آوری می کنیم.

```python import numpy as np from scipy import stats # داده های درآمد برای مهندسان نرم افزار در کانادا (به هزار دلار) canada_income = np.array([80, 85, 90, 95, 100, 105, 110, 115, 120, 125]) # داده های درآمد برای مهندسان نرم افزار در استرالیا (به هزار دلار) australia_income = np.array([75, 80, 85, 90, 95, 100, 105, 110, 115, 120]) # انجام آزمون t نمونه های مستقل t_statistic, p_value = stats.ttest_ind(canada_income, australia_income) print("T-statistic:", t_statistic) print("P-value:", p_value) # بررسی اینکه آیا مقدار p کمتر از آلفا است (به عنوان مثال، 0.05) alpha = 0.05 if p_value < alpha: print("Reject the null hypothesis") else: print("Fail to reject the null hypothesis") ```

مثال (آزمون T نمونه های زوجی):

فرض کنید شرکتی در آلمان یک برنامه آموزشی جدید را اجرا می کند و می خواهد ببیند آیا عملکرد کارکنان را بهبود می بخشد یا خیر. آنها عملکرد گروهی از کارکنان را قبل و بعد از برنامه آموزشی اندازه گیری می کنند.

```python import numpy as np from scipy import stats # داده های عملکرد قبل از آموزش before_training = np.array([60, 65, 70, 75, 80, 85, 90, 95, 100, 105]) # داده های عملکرد بعد از آموزش after_training = np.array([70, 75, 80, 85, 90, 95, 100, 105, 110, 115]) # انجام آزمون t نمونه های زوجی t_statistic, p_value = stats.ttest_rel(after_training, before_training) print("T-statistic:", t_statistic) print("P-value:", p_value) # بررسی اینکه آیا مقدار p کمتر از آلفا است (به عنوان مثال، 0.05) alpha = 0.05 if p_value < alpha: print("Reject the null hypothesis") else: print("Fail to reject the null hypothesis") ```

2. آزمون های Z

آزمون های Z برای مقایسه میانگین های یک یا دو گروه زمانی استفاده می شوند که انحراف معیار جمعیت شناخته شده باشد یا زمانی که اندازه نمونه به اندازه کافی بزرگ باشد (به طور معمول n > 30). مشابه آزمون های t، آزمون های z یک نمونه ای و دو نمونه ای وجود دارد.

مثال (آزمون Z تک نمونه ای):

کارخانه ای که لامپ در ویتنام تولید می کند، ادعا می کند که میانگین طول عمر لامپ های آنها 1000 ساعت با انحراف معیار 50 ساعت است. یک گروه مصرف کننده نمونه ای از 40 لامپ را آزمایش می کند.

```python import numpy as np from scipy import stats from statsmodels.stats.weightstats import ztest # داده های نمونه (طول عمر لامپ ها) lifespan = np.array([980, 1020, 990, 1010, 970, 1030, 1000, 960, 1040, 950, 1050, 940, 1060, 930, 1070, 920, 1080, 910, 1090, 900, 1100, 995, 1005, 985, 1015, 975, 1025, 1005, 955, 1045, 945, 1055, 935, 1065, 925, 1075, 915, 1085, 895, 1095]) # میانگین و انحراف معیار جمعیت population_mean = 1000 population_std = 50 # انجام آزمون z تک نمونه ای z_statistic, p_value = ztest(lifespan, value=population_mean) print("Z-statistic:", z_statistic) print("P-value:", p_value) # بررسی اینکه آیا مقدار p کمتر از آلفا است (به عنوان مثال، 0.05) alpha = 0.05 if p_value < alpha: print("Reject the null hypothesis") else: print("Fail to reject the null hypothesis") ```

3. ANOVA (تجزیه و تحلیل واریانس)

ANOVA برای مقایسه میانگین های سه یا چند گروه استفاده می شود. این آزمایش می کند که آیا تفاوت معنی داری بین میانگین های گروه وجود دارد یا خیر. انواع مختلفی از ANOVA وجود دارد، از جمله ANOVA یک طرفه و ANOVA دو طرفه.

مثال (ANOVA یک طرفه):

شرکت بازاریابی در برزیل می خواهد آزمایش کند که آیا سه کمپین تبلیغاتی مختلف تأثیر قابل توجهی بر فروش دارند یا خیر. آنها فروش تولید شده توسط هر کمپین را اندازه گیری می کنند.

```python import numpy as np from scipy import stats # داده های فروش برای هر کمپین campaign_A = np.array([100, 110, 120, 130, 140]) campaign_B = np.array([110, 120, 130, 140, 150]) campaign_C = np.array([120, 130, 140, 150, 160]) # انجام ANOVA یک طرفه f_statistic, p_value = stats.f_oneway(campaign_A, campaign_B, campaign_C) print("F-statistic:", f_statistic) print("P-value:", p_value) # بررسی اینکه آیا مقدار p کمتر از آلفا است (به عنوان مثال، 0.05) alpha = 0.05 if p_value < alpha: print("Reject the null hypothesis") else: print("Reject the null hypothesis") ```

4. آزمون کای مربع

آزمون کای مربع برای تجزیه و تحلیل داده های طبقه بندی شده استفاده می شود. این آزمایش می کند که آیا ارتباط معنی داری بین دو متغیر طبقه بندی شده وجود دارد یا خیر.

مثال (آزمون کای مربع):

نظرسنجی در آفریقای جنوبی از مردم در مورد وابستگی سیاسی آنها (دموکرات، جمهوری خواه، مستقل) و نظر آنها در مورد یک سیاست خاص (حمایت، مخالفت، بی طرف) می پرسد. ما می خواهیم ببینیم آیا رابطه ای بین وابستگی سیاسی و نظر در مورد سیاست وجود دارد یا خیر.

```python import numpy as np from scipy.stats import chi2_contingency # فراوانی های مشاهده شده (جدول احتمالی) observed = np.array([[50, 30, 20], [20, 40, 40], [30, 30, 40]]) # انجام آزمون کای مربع chi2_statistic, p_value, dof, expected = chi2_contingency(observed) print("Chi-square statistic:", chi2_statistic) print("P-value:", p_value) print("Degrees of freedom:", dof) print("Expected frequencies:", expected) # بررسی اینکه آیا مقدار p کمتر از آلفا است (به عنوان مثال، 0.05) alpha = 0.05 if p_value < alpha: print("Reject the null hypothesis") else: print("Fail to reject the null hypothesis") ```

ملاحظات عملی

1. فرضیات آزمون های فرضیه

بسیاری از آزمون های فرضیه فرضیات خاصی دارند که باید برای معتبر بودن نتایج رعایت شوند. به عنوان مثال، آزمون های t و ANOVA اغلب فرض می کنند که داده ها به طور معمول توزیع شده اند و واریانس های برابر دارند. مهم است که این فرضیات را قبل از تفسیر نتایج آزمون ها بررسی کنید. نقض این فرضیات می تواند منجر به نتایج نادرست شود.

2. اندازه نمونه و تجزیه و تحلیل توان

اندازه نمونه نقش مهمی در توان یک آزمون فرضیه ایفا می کند. اندازه نمونه بزرگتر به طور کلی توان آزمون را افزایش می دهد و تشخیص یک اثر واقعی را محتمل تر می کند. تجزیه و تحلیل توان می تواند برای تعیین حداقل اندازه نمونه مورد نیاز برای دستیابی به سطح مورد نظر از توان استفاده شود.

مثال (تجزیه و تحلیل توان):

بیایید بگوییم ما در حال برنامه ریزی یک آزمون t هستیم و می خواهیم اندازه نمونه مورد نیاز برای دستیابی به توان 80٪ با سطح اهمیت 5٪ را تعیین کنیم. ما باید اندازه اثر (تفاوت بین میانگین هایی که می خواهیم تشخیص دهیم) و انحراف معیار را تخمین بزنیم.

```python from statsmodels.stats.power import TTestIndPower # پارامترها effect_size = 0.5 # Cohen's d alpha = 0.05 power = 0.8 # انجام تجزیه و تحلیل توان analysis = TTestIndPower() sample_size = analysis.solve_power(effect_size=effect_size, power=power, alpha=alpha, ratio=1) print("Required sample size per group:", sample_size) ```

3. آزمایش چندگانه

هنگام انجام چندین آزمون فرضیه، احتمال ارتکاب خطای نوع اول (مثبت کاذب) افزایش می یابد. برای رفع این مشکل، مهم است که از روش هایی برای تنظیم مقادیر p استفاده کنید، مانند تصحیح Bonferroni یا روش Benjamini-Hochberg.

4. تفسیر نتایج در زمینه

تفسیر نتایج آزمون های فرضیه در زمینه سوال تحقیق و داده های تجزیه و تحلیل شده بسیار مهم است. یک نتیجه از نظر آماری معنادار لزوماً به معنای اهمیت عملی نیست. بزرگی اثر و پیامدهای واقعی آن را در نظر بگیرید.

مباحث پیشرفته

1. آزمون فرضیه بیزی

آزمون فرضیه بیزی یک رویکرد جایگزین برای آزمون فرضیه سنتی (فراوانی) ارائه می دهد. این شامل محاسبه فاکتور بیز است که شواهد مربوط به یک فرضیه را نسبت به فرضیه دیگر کمی می کند.

2. آزمون های غیر پارامتری

آزمون های غیر پارامتری زمانی استفاده می شوند که فرضیات آزمون های پارامتری (به عنوان مثال، نرمال بودن) برآورده نشوند. نمونه ها شامل آزمون Mann-Whitney U، آزمون Wilcoxon signed-rank و آزمون Kruskal-Wallis است.

3. روش های نمونه برداری مجدد (Bootstrap و Permutation Tests)

روش های نمونه برداری مجدد، مانند bootstrap و آزمون های جایگشتی، راهی برای تخمین توزیع نمونه گیری یک آماره آزمون بدون ایجاد فرضیات قوی در مورد توزیع جمعیت زیربنایی ارائه می دهند.

نتیجه گیری

آزمون فرضیه آماری ابزاری قدرتمند برای تصمیم گیری مبتنی بر داده در زمینه های مختلف از جمله علم، تجارت و مهندسی است. با درک مفاهیم اصلی، روش ها و ملاحظات عملی، دانشمندان داده می توانند به طور موثر از آزمون فرضیه برای به دست آوردن بینش از داده ها و نتیجه گیری معنی دار استفاده کنند. ماژول scipy.stats پایتون مجموعه ای جامع از توابع را برای انجام طیف گسترده ای از آزمون های فرضیه ارائه می دهد. به یاد داشته باشید که فرضیات هر آزمون، اندازه نمونه و پتانسیل آزمایش چندگانه را به دقت در نظر بگیرید و نتایج را در زمینه سوال تحقیق تفسیر کنید. این راهنما یک پایه محکم برای شما فراهم می کند تا شروع به استفاده از این روش های قدرتمند برای مشکلات دنیای واقعی کنید. به کاوش و آزمایش با آزمون ها و تکنیک های مختلف ادامه دهید تا درک خود را عمیق تر کنید و مهارت های علم داده خود را افزایش دهید.

یادگیری بیشتر:

دوره های آنلاین در آمار و علم داده (به عنوان مثال، Coursera، edX، DataCamp)
کتاب های درسی آماری
مستندات برای ماژول scipy.stats پایتون
مقالات و مقالات تحقیقاتی در مورد تکنیک های خاص آزمون فرضیه